生物信息学是一个结合生物学,计算机科学和信息技术来分析和解释复杂生物学数据的跨学科领域(Abdi等人。,2024)。最近,LLM在自然语言处理(NLP)中表现出了很大的进步,其应用程序跨越了各种各样的任务(Min等人。,2023; Raiaan等。,2024)。但是,生物数据的含义和相关任务与文本数据显着不同,带来了独特的挑战。对生物医学数据的准确和精确处理有效地形成适合LLMS的特征和嵌入是一种持续的挑战,需要创新的解决方案。在生物领域内,任务表现出高度的可变性和特异性。这些包括DNA序列的功能预测和生成,RNA结构和功能的预测,蛋白结构的预测和设计以及单细胞数据的分析,
主要关键词
![arxiv:2503.04490v1 [CS.CL] 2025年3月6日PDF文件第1页](/bimg/6/6236ebc086175fec0409fec29c5d09c1dcf6e377.webp)
![arxiv:2503.04490v1 [CS.CL] 2025年3月6日PDF文件第2页](/bimg/1/1c998d4df06f6c9f75f83ba4b977b255d4e6cd9d.webp)
![arxiv:2503.04490v1 [CS.CL] 2025年3月6日PDF文件第3页](/bimg/a/aa5589b46113d1b46c89a7a808daac0104bb6a1e.webp)
![arxiv:2503.04490v1 [CS.CL] 2025年3月6日PDF文件第4页](/bimg/a/ae7ae128d2b86b936a7c81df56b11dfb78dccdf9.webp)
![arxiv:2503.04490v1 [CS.CL] 2025年3月6日PDF文件第5页](/bimg/a/a40ba09f1fb4ed7e7586fd5f35a85867bb8d3d32.webp)
